什么是结构因果模型 | 集智百科
本词条由集智俱乐部众包生产,难免存在纰漏和问题,欢迎大家留言反馈或者前往对应的百科词条页面进行修改,一经修改,可以获得对应的积分奖励噢!
目录
十二、百科项目志愿者招募
比较两个竞争的因果模型(DCM,GCM)用于解释fMRI 图像
在科学哲学中, 因果模型 Causal Model或 结构因果模型 Structural Causal Model,是描述系统因果机制的概念模型。因果模型可以通过提供清晰的规则来决定需要考虑/控制哪些自变量,从而改进研究设计。
因果模型可以从现有的观察数据中回答一些问题,而无需进行随机对照实验等干预性研究。一些干预性研究由于伦理或实践的原因是不合适的,这意味着如果没有一个因果模型,一些假设就无法被检验。
因果模型可以帮助解决 外部有效性 External Validity问题(一项研究的结果是否适用于未研究的总体)。在某些情况下,因果模型可以允许多项研究的数据合并起来回答任何单个数据集都无法回答的问题。
因果模型是可证伪的,因为如果一些因果模型与数据不匹配,这些因果模型就必须作为无效模型而被拒绝接受。因果模型还必须使得研究相关现象的科学家们信服。
因果模型在信号处理、流行病学和机器学习中都有应用。
定义
因果模型是表示单个系统或群体内因果关系的数学模型。它有助于从统计数据中推断因果关系,可以教会我们关于因果关系的认识论,并展现因果关系和概率之间的关系。它还被应用于哲学家感兴趣的主题,例如反事实逻辑、决策理论和实际因果关系分析。
Judea Pearl将因果模型定义为一个有序的三元组<U,V,E>,其中U是一组外生变量,其值由模型外部的因素决定;V是一组内生变量,其值由模型内部的因素决定;E是一组结构方程,把每个内生变量的值表示为U和V中其他变量值的函数。
历史
亚里士多德定义了因果关系的分类法,包括质料因、形式因、动力因、目的因。休谟更偏爱反事实,他拒绝了亚里士多德的分类法。有段时间,他否认物体本身具有使得一个物体成为原因而另一个物体成为结果的“力量”。后来,他接受了“如果第一物体还没存在,第二个根本不存在”的观点(“but-for”因果关系)。
19世纪末,统计学学科开始形成。经过多年努力确定诸如生物遗传等领域的因果规则后,高尔顿引入了 均值回归 Mean Regression 的概念(以二年生症候群为缩影),后来这将他引向了非因果的相关性概念。
作为一个实证主义者,皮尔逊将因果的概念从许多科学中去除,他认为因果关系是一种无法证明的特殊的关联,并引入相关系数作为关联强度的度量方法。他写道: “作为运动原因的力,与作为成长原因的树神完全一样”,而因果关系只是“现代科学高深奥秘中的迷信”。皮尔逊在伦敦大学学院创立了期刊“Biometrika”和生物识别实验室,该实验室成为了统计领域的全球领军者。
1908年,Hardy和Weinberg通过重拾孟德尔遗传律,解决了导致高尔顿放弃因果关系的性状稳定问题。
1921年,Wright的路径分析成为因果模型和因果图的理论雏形。他开发了这种路径分析方法,试图同时阐明遗传、发育和环境对豚鼠皮毛模式的相对影响。他通过一个分析过程如何解释豚鼠出生体重、子宫内时间和产仔数之间的关系来支持他旁门左道的观点。杰出的统计学家对这些想法的反对使因果关系在接下来的40年中被家畜育种学家之外的科学家所忽略。取而代之的是,科学家们依赖于相关性,一定程度上是在批评Wright的领军统计学家Fisher的授意下。唯一的例外是一名叫Burks的学生,在1926年首先应用路径图来表示中介影响,并断言保持中介变量恒定会引起误差。她可能独立地发明了路径图。
1923年,Neyman提出了潜在结果(potential outcome)的概念,但是直到1990年他的论文才被从波兰语翻译成英语。
1958年,Cox警告说,仅当Z高概率不被自变量影响的时,控制变量Z才有效。
20世纪60年代,Duncan、Blalock、Goldberger等人重新发现了路径分析。Duncan在阅读Blalock关于路径图的著作时,想起了二十年前Ogburn的一次演讲,其中提到了Wright的论文,而后又提到了Burks。
社会学家最初将因果模型称为 结构方程模型 Structural Equation Modeling ,但一旦它成为教条式方法就失去了效用,导致一些从业者拒绝与因果关系的任何联系。经济学家采用了路径分析的代数部分,称其为 联立方程建模 Simultaneous Equation Modeling 。但是,经济学家仍然避免将因果含义赋予他们的方程式。
Wright在发表第一篇论文60年后,根据Karlin等人的批评,发表了一篇概述该论文的文章,该论文反对仅处理线性关系,而鲁棒的、非模型的数据表示方式则更具揭示性。
1973年,Lewis提倡用but-for因果关系(反事实)代替相关性。他提到了人类具有想象某个原因是否发生和结果仅在原因后发生的不同可选世界的能力。1974年Rubin引入了“潜在结果 potential outcome”的概念,作为询问因果问题的语言。
1983年,Cartwright提出与一个结果因果相关的任何因子都是有条件的,不再以简单的概率作为唯一指导。
1986年,Baron和Kenny引入了检测和评估线性方程系统中的中介的原理。截至2014年,他们的论文是有史以来被引用最多的第33篇。那年,Greenland和Robins通过考虑反事实,引入了“可交换性”方法,来处理混杂问题。他们提出评估如果治疗组没有接受治疗会给治疗组带来什么后果,并将其结果与对照组进行比较。如果结果一致,说明没有混杂因子。
哥伦比亚大学设有因果人工智能实验室,该实验室正试图将因果建模理论与人工神经网络联系起来。
因果关系之梯
Judea Pearl的因果元模型涉及三个层次的抽象,他称之为因果之梯。最低层的“关联”(看到/观察)需要感知输入数据中的规律性或模式,用相关性表示。中间层的“干预 ”(do)可以预测有意识行动的后果,用因果关系表示。最高层的“反事实”(想象)涉及构建部分世界的理论,该理论解释为什么特定行为会产生特定后果,以及在没有此行为的情况下会发生什么。
关联
如果观察一个对象改变了观察另一个对象的可能性,则这个对象与另一个对象相关联。例子:购买牙膏的购物者也更有可能购买牙线。数学上用
P(买牙线|买牙膏)
表示已知一个人购买牙膏时的其购买牙线的可能性。关联也可以通过计算两个事件的相关性来衡量。关联并不意味着因果。一个事件可能导致另一个事件,反过来也可能,或者两个事件都可能由某个第三事件引起(牙医对口腔健康的宣传使得购物者同时购买牙线和牙膏)。
干预
该层涉及事件之间的特定因果关系。因果是通过实验性地执行影响事件的一些动作来评估。例如:如果我们将牙膏的价格提高一倍,那么人们购买牙线的概率将是多少?因果无法通过检验历史信息来确定,因为可能存在其他因素同时影响这两个变量,比如存在牙膏价格变化的其他原因,而且这种原因会影响牙线的价格(例如两种商品的关税增加)。数学上用 P(牙线价格|do(牙膏价格)) 表示这种概率。其中do是一个算子,表示对谁做实验性干预(如价格翻倍)。这个算子指示了要在创造所需效果的世界中进行最小的变化,即在现实模型上进行尽可能小的改变的“小手术”。
反事实
最高层的反事实涉及对过去事件的其他可能版本的考虑,或者考虑同一实验个体中在不同情况下会发生的情况。例如,如果当初那家商店的牙线价格翻了一番,那么当时那些购买牙膏的购物者仍然会购买牙线的可能性是多少?
P(买牙线|买牙膏,当初牙线价格翻倍)
反事实可以表明存在因果关系。回答反事实的模型允许进行精确的干预,这些干预的后果可被预测。在极端情况下,这样的模型被人们认为是物理定律(如惯性:若不将力施加到静止物体上物体将不会移动)。
因果
因果和相关
统计学涉及分析多个变量之间的关系。传统上,这些关系被描述为相关性,即没有任何隐含因果关系的关联。因果模型试图通过添加因果关系的概念来扩展此框架,在因果关系中,一个变量的变化导致其他变量的变化。
20世纪因果的定义完全依赖于概率或关联。如果一个事件X增加了另一个事件Y的可能性,则认为它会导致另一个事件。在数学上,这表示为:
P(Y|X)>P(Y)
这样的定义是不充分的,因为可能有其他关系(例如,X和Y的共同原因)可以满足该条件。因果与因果之梯的第二层有关。关联处于第一层,仅向第二层提供证据。
之后的定义试图通过以背景因素为条件来解决这种歧义。数学上表示为:
P(Y|X,K=k)>P(Y|K=k)
其中K是背景变量的集合,k表示特定语境中背景变量的值。但是,只要概率是唯一准则,那么所需的背景变量集是难以确定的。
定义因果的其他尝试包括 格兰杰因果 Granger Causality ,这是一种统计假设检验,在经济学中,可以通过衡量用一个时间序列的过去值预测另一个时间序列的未来值的能力,来评估序列间的因果。
类型
原因可以是必要的、充分的、部分的以及它们的组合。
必要因
对于y的必要因x,y的存在意味着x在此前发生了。但是x的存在不意味着y会发生。必要因也被称为“若非(but-for)”因,即y不会发生若非x发生。
充分因
对于y的充分因x,x的存在意味着y接下来会发生。然而另一个原因z也可能独立地造成y的发生。即y的发生不要求x的发生。
促成因
对于y的促成因x,x的存在会增加y的似然。如果似然是100%,那么x就是充分的。促成因也是必要的。
模型
因果图
因果图是一个有向图,它显示了因果模型中变量间的因果关系。因果图包括一组变量(或节点),每个节点通过箭头连接到一个或多个对其具有因果效应的其他节点。箭头描绘了因果的方向,例如,将变量A和变量B以指向B的箭头相连表示A的变化以某种概率导致B的变化。一条路径是两个节点间沿着因果箭头的图的遍历。
因果图包括 因果环图 Causal Loop Diagrams , 有向无环图 Directed Acyclic Graphs 和 鱼骨图 Ishikawa diagrams。
因果图和它们的定量概率无关,对这些概率的更改不需要修改因果图。
模型元素
因果模型具有形式结构,其元素具有特定的属性。
连接方式
三个节点的连接类型有三种,分别是线型的链,分支型的叉和合并型的对撞。
链
链(结构)是直线连接,箭头从原因指向结果。在这个模型中,B是中介变量,因为它调节了A对C的影响。
A→B→C
叉
在叉(结构)中,一个原因有多种结果,这两种结果有一个共同的原因。A和C之间存在非因果的虚假相关性,可以通过把B作为条件(选取B的特定值)来消除虚假相关性。
A←B→C
“把B作为条件”是指“给定B”(即B取某个值)。某些情况下叉(结构)是混杂因子:
A←B→C→A
在这样的模型中,B是A和C的共同原因( C也是A的原因),这使B成为 混杂因子 Confounder 。
对撞
在对撞(结构)中,多种原因会影响一种结果。以 B为条件(B取特定值)通常会揭示A与C之间的非因果的负相关。这种负相关被称为对撞偏差和“辩解”效应,即B解释了A与C之间的相关性。A和C两者都是影响B的必要因时,该相关性是正的。
A→B←C
节点类型
中介变量
中介变量节点修改了其他原因对结果的影响(这与原因简单地影响结果不同)。例如,在上面的链结构中,B是中介变量,因为它修改了C的间接原因A对结果变量 C的影响。
混杂因子
混杂因子节点影响多个结果,从而在它们之间产生正相关。
工具变量
满足如下条件的是工具变量:
有通往结果变量的路径 没有通往其他原因变量(解释变量)的路径 对结果没有直接影响
回归系数可以用作工具变量对结果的因果影响的估计,只要该影响不被混杂即可。通过这种方式,工具变量允许对因果因子进行量化,而无需有关混杂因子的数据。例如,给定模型:
对该技术的改进包括通过调节其他变量来创建工具变量,以阻断工具变量和混杂因子之间的路径,并组合多个变量以形成单个工具变量。
孟德尔随机化
由于基因在人群中随机变化,基因的存在通常可以视为工具变量。这意味着在许多情况下,可以使用观察性研究中的回归来量化因果关系。
关联
将变量作为条件是进行假设实验的一种机制。将变量作为条件即在条件变量的给定值下分析其他变量的值。在第一个示例中,B作为条件意味着给定B的取值的观察,此时不应显示出A和C之间的依赖关系。如果存在这种依赖关系,则该模型是不正确的。非因果模型无法进行这种区分的,因为它们不会做出因果断言。
混杂/去混杂
因果模型为识别恰当的混杂变量提供了一种鲁棒的技术。形式上,如果“Y通过不经过X的路径与Z关联”,则Z 是混杂因素。这些混杂变量通常可以使用其他研究所收集的数据来确定。数学上,如果:
“与X和Y都相关的任何变量。” Y和未观测变量Z有关联 不相容性:“原始相对风险和潜在混杂因素调整后产生的相对风险”之间的差异 流行病学:在大范围总体中与 X相关的变量,而在未接触X的人群中与Y相关的变量。
在模型中
后门调整
通过该集合阻塞X和Y之间的每个非因果路径 不破坏任何原有的因果路径 不创建任何虚假路径
混杂变量集Z中没有X的后代, X和Y之间的所有后门路径都被Z中的混杂变量阻断,
前门调整 Frontdoor Adjustment
Z阻断了所有X到Y的有向路径 X到Y没有后门路径 所有Z到Y的后门路径都被X阻断
干预
查询
Do演算
do演算规则集
版本1
版本2
版本3
扩展
反事实
潜在结果 Potential Outcome
因果推断
因果推断的第一定律意味着潜在结果:
YX (u)=YMx (u)
计算反事实 Conducting a counterfactual
归因 Abduct
行动 Act
预测 Predict
中介Mediation
直接效应 Direct effect
间接效应 Indirect effect
可移植性
贝叶斯网络 Bayesian network
不变量/语境 Invariants/Context
编者推荐
书籍推荐
《统计因果推理入门》封面
统计因果推理入门 对应英文Causal Inference in Statistics: A Primer
为什么-关于因果的新科学
课程推荐
文章总结
因果科学入门读什么书?Y. Bengio博士候选人的研读路径推荐
历时3个月,全球32位讲者,共同讲述因果科学与Causal AI的全景框架!
百科项目志愿者招募
作为集智百科项目团队的成员,本文内容由Sikongpop用户参与编译,LFZ参与审校,思无涯咿呀咿呀编辑。我们也为每位作者和志愿者准备了专属简介和个人集智百科主页,更多信息可以访问其集智百科个人主页。
在这里从复杂性知识出发与伙伴同行,同时我们希望有更多志愿者加入这个团队,使百科词条内容得到扩充,并为每位志愿者提供相应奖励与资源,建立个人主页与贡献记录,使其能够继续探索复杂世界。
如果你有意参与更加系统精细的分工,扫描二维码填写报名表,我们期待你的加入!
来源:集智百科
编辑:王建萍
点击“阅读原文”,阅读结构因果模型词条原文与参考文献